خلاصه سازی خودکار متن انگلیسی

پایان نامه
چکیده

خلاصه سازی یک فرآیند تصمیم گیری است که در آن برای هر جمله چندین معیار در نظر گرفته می شود و ارزش هر جمله در معیارها سنجیده می شود. سپس با سبک و سنگین کردن نتایج ارزیابی ها جملات برای حضور در خلاصه انتخاب می شوند. در این پایان نامه معماری جدیدی برای سیستم های خلاصه ساز ارائه شده است. در این معماری یک لایه ی تصمیم گیرنده به عنوان آخرین لایه در سیستم، مسئولیت امتیازدهی به جملات بر اساس امتیاز هر جمله در ویژگی های مجزا را بر عهده دارد. در واقع این لایه، عمل سبک و سنگین کردن جملات را انجام می دهد. وجود این لایه ی تصمیم گیر نیاز به داده های آموزشی برای محاسبه ی وزن های هر کدام از ویژگی های مورد بررسی را مرتفع می سازد. گرچه می توان دقت این لایه را بر اساس داده های آموزشی افزایش داد و یا اینکه با آموزش آن، سیستم های خلاصه ساز شخصی ساخت. ماتریس تصمیم به عنوان جز اصلی در تصمیم گیری چندمعیاره مورد استفاده قرار می گیرد. در ساخت ماتریس تصمیم هر جمله به عنوان یک سطر و هر یک از ویژگی های مورد بررسی نیز به عنوان یک ستون در نظر گرفته می شوند. در این پایان نامه روش آماری-زبان شناسی جدیدی نیز برای خلاصه سازی خودکار متن ارائه شده است. در این روش بر اساس ماتریس ارتباط، موضوعات مختلف در متن کشف و جملات متن در هر یک از این موضوعات کلاس بندی می شوند. سپس به روشی که در قسمت مربوطه آورده شده است امتیاز هر کدام از جملات و موضوعات تعیین می شوند. با توجه به امتیازها و روند به روز کردن امتیازها در چند گام خلاصه تولید می شود. در این پایان نامه تولید خلاصه های از نوع گزینشی تک سندی مد نظر بوده است. واحد خلاصه سازی، جمله در نظر گرفته شده است و تولید خلاصه های عمومی از مقالات علمی به زبان انگلیسی مورد بررسی قرار گرفته اند. روش های پیشنهادی نیز بر اساس همین پارامترها ایجاد شده اند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه تربیت معلم - تهران - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023